新 疆 天 文 台 NSRT 观测 数据 存储 系统 * 


JEJE 12, ARE 10, XE CU, REFL RAL, xIR+, EARL, EARL Wwe HEF 
提 努 尔 !， 张 萌 42 
a. 中 国 科学 院 新 疆 天 文 台 , 新 疆 乌鲁木齐 , 830011; 2. 中 国 科 学 院 射 电 天 文 重点 实验 室 ， 
江苏 南京 ，210008; 3. 中 国 科 学 院 大 学 ， 北 京 ，100049 ) 


摘要 : 新 疆 天 文 台南 山 26m 射电 望远镜 (简称 NSRT) 经 过 多 年 观测 积累 了 
大 量 的 科学 数据 。 针 对 NSRT 天 文 观测 数据 的 在 线 存储 与 备份 问题 ， 建 设 了 远 
程 、 异 地 、 容 灾 备 份 系统 ， 在 新 疆 天 文 台 本 部 及 南山 观测 站 分 别 建设 了 可 独立 
运行 的 存储 系统 ， 实 现 了 两 套 存 储 系统 间 的 远程 、 异 地 数据 实时 容 灾 备份 。 以 
基于 对 象 的 存储 技术 Lustre 为 基础 实现 了 存储 系统 ， 并 对 存储 的 读 写 性 能 进行 
了 详细 测试 。 建 设 的 容 灾 备份 系统 有 效 解决 了 新 疆 天 文 台 观测 数据 及 次 生 数 据 
的 在 线 存储 与 数据 安全 问题 。 
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SKA 的 先驱 阵列 望远镜 MWA”"， 由 2048 面 低频 阵列 望远镜 组 成 ， 相 关 后 每 秒 
归档 数据 在 400MB 左右， 数据 首先 在 线 归 档 在 MR0 天 文 台 的 数据 存储 中 ， 然 后 通 
过 10Gpbs 专线 将 数据 实时 传输 备份 到 位 于 MRO 700 FASKA Pawsey 数据 中 
心 ， 同 时 Pawsey 数据 中 心 数 据 按 需求 再 通过 1Gpbs 线路 备份 到 MIT, USA. VUW, 
New Zealand. RRI, India'. 

中 国 科学 院 国 家 天 文 台数 据 中 心 是 中 国 目 前 最 大 的 天 文 数 据 库 ， 包 括 国 家 
天 文 台 下 属 的 各 天 文 观测 设备 产生 的 天 文 数据 , 还 有 部 分 其 它 天 文 台 站 的 观测 数 
据 ， 目 前 数据 中 心 部 分 数据 备份 在 中 国 科 学 院 网 络 中 心 ， 部 分 数据 备份 在 阿里 云 
平台 。 

中 国 科学 院 紫金 山 天 文 台 对 外 开放 的 数据 库 “包括 毫米 波 射 电 天 文 数据 库 、 
太阳 射电 频谱 观测 数据 库 、 近 地 天 体 望远镜 数据 库 、 太 阳光 谱 数 据 库 等 ， 各 数 
据 库 已 实现 在 线 访问 ， 并 建立 了 相应 数据 备份 系统 。 

斯 特 拉 斯 堡 天 文 数据 中 心 、 欧 洲 南 方 天 文 台 科学 数据 中 心 ^. CSIRO ATNF 
数据 归档 中 心 "、 中 国 科学 院 上 海天 文 台 "、 中 国 科学 院 云 南天 文 台 等 天 文 研究 
机 构 都 分 别 建设 了 数据 管理 系统 。 

1、NSRT 数据 情况 简介 

新 疆 25m 射电 望远镜 "建成 于 1993 年 12 月 并 投入 使 用 , 经 过 升级 改造 后 口 
径 扩 大 到 26m, 新 的 26m 射电 望远镜 简称 NSRT ( NanShan Radio Telescope). NSRT 
承担 着 重要 的 国际 合作 及 国内 重大 课题 的 天 文 观测 任务 , 目前 是 欧洲 甚 长 基线 干 
涉 网 EVN), 国际 动力 测 地 网 CIVs)， 俄 罗斯 低频 VLB 网 CLFVN )， 东 亚 VLBI) 
4 个 国际 合作 组 织 的 正式 成 员 。 参 加 了 11 项 国际 合作 计划 ， 承 担 着 国家 攀登 计 
划 、 大 科学 工程 、 绕 月 工程 、 火 星 探测 、 国 家 自然 科学 基金 课题 、 中 国 科 学 院 基 
础 研究 重点 项 目 以 及 多 项 单 天 线 国 际 合作 天 文 观测 研究 任务 和 项 目 。 

NSRT 开展 了 脉冲 星 、 分 子 谱 线 、IDV 巡天 和 监测 等 多 项 课题 ,支持 了 银 道 面 


1 http://www.mwatelescope.org/telescope/data-archive 

? http://www.china-vo.org/ 

3 http://www.pmo.ac.cn/qt/twsjk/ 

^ http://cdsweb.u-strasbg.fr/ 

5 http://archive.eso.org/cms.html 

6 http://www.atnf.csiro.au/observers/data/index.html 

7 http://119.78.226.68/ 

8 http://fso.ynao.ac.cn/dataarchive_ql.aspx 

9? http://www.xao.ac.cn/jgsz/ywtz/nsjd/25msd/ 

10 https://en.wikipedia.org/wiki/Very-long-baseline interferometry 


磁场 巡天 、 木 星 研究 等 观测 。 设备 运 行 有 效 观 测 时 间 连 创 国 内 同类 射电 望远镜 新 
高 ， 在 国内 外 天 文 观测 研究 中 发 挥 了 积极 的 作用 。 随 着 观测 数据 的 狐 烈 增长 ， 如 
何 永久 保存 这 些 珍贵 的 天 文 观测 数据 , 如 何 合 理 有 效 地 解决 这 些 数据 的 在 线 存 储 
管理 问题 ， 如 何 高 效 地 实现 远程 、 异 地 容 灾 备份 是 新 疆 天 文 台 26 米 射 电 望 远 镜 
运行 中 面临 的 一 个 重要 课题 中。 

2000 年 1 月 至 2002 年 6 月 ，NSRT 脉冲 星 观 测 系统 由 一 个 双 通 道 室温 接 收 
机 ， 带 宽 320 MHz， 中 心 频率 1540 MHz， 消 色散 系统 采用 2x128x2.5 MHz 模拟 滤 
波 器 组 实现 ， 得 到 的 脉冲 星 数据 格式 为 “Timer” 辐 。2002 年 下 半年 低温 接收 机 
系统 投入 使 用 ,制冷 后 的 接收 系统 使 天 线 灵敏 度 达 到 了 0.5 my. 2010 年 1 月 ， 
DFB( 数 字 滤 波 器 系统 ) 投 入 使 用 ，DFB 系统 具有 更 高 的 时 间 分 辨 率 ， 使 得 NSRT 可 
以 常规 的 观测 到 大 约 280 颗 脉 冲 星 ， 其 中 包括 10 颗 毫 秒 脉冲 星 ，DFB 系统 的 数 
据 记 录 格 式 为 “Psrfit”，“psrchive” 程 序 可 以 读 取 和 分 析 数 据 。 通 过 十 多 年 的 观测 ， 
脉冲 星相 关 观 测 积累 了 大 量 数据 ， 目 前 已 发 布 56000 多 条 有 效 原 始 数据 记录 ， 原 
始 数据 及 处 理 后 数据 总 量 近 20TBPl. 

利用 NSRT 开展 了 分 子 谱 线 OH, H2CO, NH3, H20 等 观测 ， 从 2010 年 开始 ， 
数字 消 色 散 系统 应 用 后 ， 产 生 的 原始 数据 格式 为 RPFits， 获 得 的 分 子 谱 线 原始 数 
据 经 过 校准 之 后 ， 可 用 来 估算 星际 介质 ， 分 子 云 的 物理 化 学 性 质 回 ， 目 前 分 子 谱 
线 相 关 已 归档 数据 量 在 5TB 左右 。 

自 2004 年 起 ， 利 用 NSRT 的 6 厘米 连续 谱 观 测 系统 开展 了 河 外 射电 源 的 流 
量 监 测 ， 包 括 北 天 blazar 天 体 的 大 样本 快速 光 变 巡天 ， 以 及 Fermi AGN 的 长 期 射 
电流 量 监测 等 观测 项 目 中 。 连 续 谱 观测 系统 终端 由 马 普 射电 所 研发 的 便携 式 终端 
实现 ， 其 工作 的 中 心 频率 为 4800MHz， 带 宽 为 600MHz。 原 始 数据 为 FITS 格式 ， 
观测 数据 需要 进行 指向 、 大 气 不 透明 度 、 增 益 以 及 时 间 依 赖 等 校准 ， 最 终 转 换 成 
射电 源 绝对 流量 后 可 应 用 于 科学 研究 中 。 经 过 多 年 的 观测 和 积累 ， 连 续 谱 观测 获 
取 了 一 800 个 射电 源 的 共计 约 250000 条 有 效 原 始 数据 记录 ， 数 据 量 约 10TB。 
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图 1 新 疆 天 文 台 26 米 射电 望远镜 数据 存储 备份 系统 设计 


2、 数 据 存储 与 备份 系统 设计 


NSRT 数据 存储 备份 系统 设计 如 图 1， 设 计 共 包含 三 个 部 分 ， 第 一 部 分 
观测 数据 获取 与 在 线 归 档 ， 第 二 部 分 完成 原始 观测 数据 的 异地 备份 ， 第 三 部 分 
负责 数据 发 布 共享 。 

第 一 部 分 :数据 获取 与 在 线 归档 部 分 在 南山 观测 基地 完成 , 由 26 米 望 远 镜 、 
接收 机 系统 、DFB 系统 、 数 据 暂 存 系统 及 归档 系统 组 成 。 数 据 获取 以 脉冲 星 观 
测 为 例 ， 脉 冲 星 的 数据 采集 和 处 理 以 及 数据 记录 由 望远镜 接收 系统 完成 ， 数 据 
采集 程序 实时 完成 数据 采集 、 数 据 预 处 理 、 脉 冲 星 周 期 计算 和 周期 登 加 、 数 据 
存盘 、 消 色散 数据 显示 、 观 测 纲 要 查询 、 图 形 输 出 、 天 线 姿态 控制 等 儿 个 任务 。 
观测 中 典型 的 采样 速率 为 1 ms， 每 次 观测 时 间 由 脉冲 星 在 该 观测 频段 的 流量 强 
度 决 定 ， 一 般 为 2 一 16 分 钟 。 数 据 经 过 预 处 理 后 写 入 暂 存 服务 器 中 ， 经 过 科学 
家 确认 有 效 后 数据 将 实现 永久 归档 。 

第 二 部 分 : 原始 观测 数据 的 异地 备份 (新 疆 天 文 台 本 部 位 于 南山 观测 基地 
北部 100KM 左右 ) 通过 南山 观测 基地 到 新 疆 天 文 台 本 部 间 的 专线 实现 ,专线 速 
FE 300Mbps, 数据 由 南山 的 Permanent Online Archive 同步 到 新 疆 天 文 台 本 部 
Long-term Online Archive， 同 步 起 始 时 间 每 天 零点 开始 ， 目 前 采用 NGAS 
(Next-Generation Archive System, Andreas) 传输 原始 观测 数据 。 用 户 可 以 登陆 新 
ES Taurus 高 性 能 计算 系统 ， 下 载 并 处 理 数据 ，Taurus 与 Long-term Online 
Archive 间 采 用 56Gbps Infiniband 交换 设备 互 连 , 用 户 处 理 后 数据 可 根据 需要 进 
行 归档 、 发 布 。GAVO (German Astrophysical Virtual Observatory) Servers 主要 
用 于 数据 发 布 及 处 理 后 数据 存储 ， 原 始 观测 数据 元 数据 信息 提取 后 ， 将 被 导入 
到 相应 的 数据 库 中 ， 为 数据 发 布 做 准备 。 数 据 存储 、Taurus 与 GAVO 服务 器 间 
采用 NFS 方式 实现 数据 互 操作 。 针 对 数据 库 数 据 ， 在 新 疆 天 文 台 本 部 及 南山 观 
测 基 地 均 有 备份 。 目 前 新 疆 天 文 台 奇 台 观 测 基 地 与 台 本 部 间 已 经 建成 100Mbps 
MSTP (Multi-Service Transfer Platform 多 业务 传送 平台 ) 专线 ， 为 满足 奇 台 前 期 
建设 及 多 种 设备 数据 采集 需要 , 已 在 奇 台 基地 部 署 了 一 套 20TB 存储 , 这 套 存 储 
同时 也 可 以 满足 数据 库 备 份 的 需要 。 

第 三 部 分 ， 由 分 别 位 于 南山 及 奇 台 观测 站 的 数据 备份 系统 及 数据 发 布 平 台 
组 成 。 两 套数 据 备 份 系统 利用 专线 网 络 分 别 实现 本 部 重要 数据 的 远程 、 异 地 容 
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灾 ， 数 据 发 布 系统 以 新 疆 天 文 台数 据 中 心 为 基础 实现 观测 数据 基于 虚拟 天 文 台 
标准 的 发 布 、 高 效 数 据 检 索 与 数据 获取 外。 


3、 存 储 系统 实现 
3.1 存储 技术 介绍 


存储 系统 根据 服务 器 类 型 可 分 为 封闭 系统 存储 和 开放 系统 存储 ， 封 闭 系统 
主要 应 用 于 大 型 机 ， 开 放 系 统 指 基于 Windows, UNIX”, Linux HRE AZ 
的 服务 器 。 开 放 系 统 存储 又 分 为 内 置 存 储 和 外 挂 存储 ; 外 挂 存 储 根据 连 接 的 方 
式 分 为 直 连 式 存储 (Direct-Attached Storage， 简 称 DAS!) 和 网 络 化 存储 
(Fabric-Attached Storage， 简 称 FAS) ; 网 络 化 存储 根据 传输 协议 又 分 为 : 网 
络 接 入 存储 (Network-Attached Storage， 简 称 NAS!9) 和 存储 区 域 网 络 
(Storage Area Network， 简 称 SANY) ， 有 具体 如 图 2 Aras. 


封闭 系统 的 存储 
{ Ba Direct-Attached Storage 
开放 系统 的 存储 { nie] 直 连 式 存储 (DAS) we weed Storage 
Fabric-Attached Storage 网 络 接 入 存储 (NAS) 
网 络 存 储 (FAS) Storage Area Network 
存储 区 域 网 络 (SAN) 


图 2 存储 系统 分 类 


DAS 为 当前 最 主要 的 应 用 模式 ， 存 储 系统 被 直 连 到 服务 器 ， 依 赖 服务 器 主 
机 操作 系统 进行 数据 的 VO 和 存储 维护 管理 ， 数 据 备份 和 恢复 占用 服务 器 主机 
CPU'S, AR IO” 等 资源 ， 数 据 流 需 要 回流 主机 再 到 服务 器 存储 ， 数 据 备份 等 
操作 约 占用 服务 器 主机 资源 的 20-3096, DAS 存储 性 能 依赖 于 所 接 入 的 服务 器 


设备 。 


11 https://www.microsoft.com/zh-cn/ 

12 http://www.unix.org/ 

13 https://www.linux.org/ 

14 https://en.wikipedia.org/wiki/Direct-attached_storage 
15 https://en.wikipedia.org/wiki/NetApp_filer 

16 https://en.wikipedia.org/wiki/Network-attached_storage 
17 https://en.wikipedia.org/wiki/Storage_area_network 

18 https://en.wikipedia.org/wiki/Central_processing_unit 
19 https://en.wikipedia.org/wiki/Input/output 
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NAS 存储 也 称 网 络 附加 存储 ， 存 储 设备 通过 标准 的 网 络 拓扑 结构 添加 到 单 
台 计 算 机 或 高 性 能 计算 系统 。NAS 是 文件 级 的 存储 方案 ， 可 以 满足 迅速 增加 存 
储 容量 的 需求 。 文 持 即 插 即 用 、 文 持 多 计算 平台 , 适用 于 Unix/Windows 局 域 网 ， 
同时 部 署 、 应 用 非常 灵活 ， 但 在 备份 过 程 中 的 带宽 消耗 较 大 。NAS 使 用 网 络 带 
宽 进 行 备份 和 恢复 ， 网 络 除了 必须 处 理 正常 的 最 终 用 户 数据 传输 外 ， 还 必须 处 
时 包括 备份 操作 的 存储 磁盘 VO 请 求 。 


eH 


SAN 存储 也 称 存 储 区 域 网 络 ， 通 过 光纤 通道 交换 设备 连接 存储 阵列 和 服务 
器 主机 ， 构 建 专用 的 存储 网 络 ， 通 过 同一 物理 通道 支持 SCSI PHX, 
许 任 何 服务 器 连接 到 任何 存储 阵列 ，FCSAN” 采 用 光纤 接口 具有 更 高 的 带宽 ， 
光纤 接口 支持 超过 10KM 线路 长 度 ， 使 得 物理 上 分 离 的、 不 在 同一 机 房 的 备份 
存储 变 得 容易 实现 。 


基于 对 象 的 存储 (Object-Based Storage, OBS? )， 其 核心 是 将 数据 通路 
《数据 读 、 写 ) 和 控制 通路 (元 数据 ) 分 离 。 基 于 对 象 存储 CObject-based Storage 
Target, OST) 构建 系统 , 每 个 对 象 存储 设备 能 够 自动 管理 自身 存储 的 数据 分 布 ， 
且 有 具备 一 定 智 能 。 对 象 存储 结构 由 对 象 、 对 象 存储 设备 、 元 数据 服务 器 、 对 象 
存储 系统 的 客户 端 四 部 分 组 成 。OBS 的 网 络 带宽 、IO 吞吐 量 、 文 件 系统 容量 以 
及 处 理 能 力 是 随 着 存储 节点 的 增加 而 同步 线性 增长 ， 因 而 具有 很 好 的 性 能 和 扩 
展 性 ， 存 储 节点 可 扩展 、 存 储 对 象 数 可 扩展 性 、 存 储 对 象 空间 也 具有 可 扩展 性 。 
可 以 实现 大 规模 的 海量 数据 访问 的 高 度 并 行 ， 采 用 文件 数据 与 元 数据 分 离 存 储 
的 机 制 ， 通 过 条 带 化 技术 将 传统 文件 的 数据 分 解 存储 到 存储 对 象 中 ;文件 元 数 
据 则 保存 在 元 数据 对 象 中 ， 并 具有 一 个 全 局 唯一 的 对 象 标识 以 及 一 些 文件 属性 


= 向 


El 4o 


存储 局 域 网 (SAN) 和 网 络 附 加 存储 (NAS) 是 目前 两 种 主流 网 络 存储 架构 , 而 
对 象 存储 OBS 是 一 种 新 的 网 络 存储 架构 ，OBS 综合 了 NAS 和 SAN 的 优点 ， 
同时 具有 SAN 的 高 速 直接 访问 和 NAS 的 分 布 式 数据 共享 等 优势 ， 提 供 了 具有 
高 性 能 、 高 可 靠 性 、 跨 平台 以 及 安全 的 数据 共享 存储 体系 结构 。 
2 bnps/envdpedia e 


2 https://en.wikipedia.org/wiki/Fibre_Channel 
2 https://en.wikipedia.org/wiki/Object_storage 
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3.2 存储 系统 实现 


综合 考虑 DAS, NAS, SAN, OBS 技术 的 优 缺 点 及 目前 新 疆 天 文 台 观 测 数 
据 的 存储 需要 ， 最 终 采 用 基于 对 象 的 存储 技术 实现 存储 系统 。 系 统 以 Linux 下 
的 Lustre Aktit, Lustre 是 基于 对 象 存 储 的 高 性 能 分 布 式 文 件 系统 ， 源 代码 开 
放 ， 使 用 基于 对 象 的 磁盘 存储 数据 ， 元 数据 服务 器 为 整个 文件 系统 提供 元 数据 
服务 。 系 统 结构 如 图 2 所 示 ， 系 统 采用 两 套 网 络 系统 互 连 ， 56Gb Infiniband 交 
换 主 要 负责 存储 系统 各 服务 器 间 链 路 ， 提 供 高 速 数 据 交换 能 力 ， 王 兆 以 太 网 实 
现 管理 。 整 个 系统 由 两 个 元 数据 服务 器 CMDS) 组 成 ， 两 个 MDS 采用 主 备 模 
sh, 数据 实时 同步 ， 当 主 MDS 故障 时 ,备用 MDS 将 接 蔡 工作 ， 主 备 模式 降低 了 
系统 故障 率 , 保障 了 元 数据 信息 正常 访问 。 采 用 3 台 基 于 对 象 的 存储 设备 (OST) 
作为 目标 存储 节点 ， 实 现 了 100TB 的 可 用 存储 空间 。 


InfiniBand 
56Gb 


2 存储 系统 原理 图 


7^ http://www.lustre.org/ 
25 https://en.wikipedia.org/wiki/InfiniBand 


Lustre 客户 端 


Linux VFS Le . 
Lustre 客户 端 FS 元 数据 服务 器 


LOV x TEENE 
文件 访问 请 求 


元 数据 交互 
! inode A (obj1, obj2) 
OST2 


读 (目标 2) 


3 Linux 客户 端 并 行 读 写 示 意图 
所 建设 的 集中 式 Lustre 存储 系统 最 终 被 连接 到 两 台 1/0 服务 器 , 1/0 服务 器 
也 采用 主 备 模式 ， 一 台 在 线 为 客户 提供 服务 ， 一 台 备 份 。 对 于 Linux bP, a 


要 安装 相应 的 Lustre 客户 端 软件 ， 完 成 挂 载 后 可 以 看 到 100TB 存储 空间 。 其 数 
据 访 问 示意 如 图 3 所 示 ，Linux 虚拟 文件 系统 ” (VFS) 通过 同一 套 文件 WO 系 
统 实现 linux 中 的 任意 文件 操作 ， 无 需 考虑 其 所 在 的 具体 文件 系统 格式 ， 为 能 
够 文 持 各 种 实际 文件 系统 ，VFS 定义 了 所 有 文件 系统 均 支 持 的 基本 的 、 概 念 上 
的 接口 和 数据 结构 ，Lustre FS( 文 件 系统 ) 提 供 VES 所 期 望 的 抽象 接口 和 数据 结 
构 ， 将 自身 的 文件 、 目 录 等 概念 在 形式 上 与 VFS 的 定义 保持 一 致 ， 实 现 两 套 系 
统 间 数 据 传递 。 逻辑 存储 卷 LOV) 负责 收集 OST 信息 到 单一 卷 中 ， 用 户 的 读 
写 通过 对 象 存储 客户 端 (OSC) EW, osc 得 到 用 户 的 读 写 请 求 后 ， 经 过 元 数据 
客户 端 (MDC) 查找 元 数据 服务 器 CMDS) 中 对 应 的 数据 所 在 OST 中 位 置 并 返 
回 地 址 信息 ，OSC 得 到 OST 的 具体 信息 后 实现 并 行 数据 读 写 。 


3.3 存储 性 能 测试 

利用 专业 的 存储 性 能 测试 工具 IOZONE2 对 所 建设 的 系统 读 、 写 性 能 分 别 以 
单 节点 、 多 节点 测试 得 到 了 相应 结果 。 

1、 单 节点 性 能 


测试 命令 : ./iozone -a -g 64G -i0 -i 1 -i 2 -f /home/iozone -Rb single.xls 


26 https://en.wikipedia.org/wiki/Virtual file system 
27 https://en.wikipedia.org/wiki/IOzone 
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参数 说 明 : 使 用 全 自动 模式 , 生成 包括 所 有 测试 报告 , 使 用 的 块 大 小 从 4KB 
到 16MB, 最 大 测试 文件 64GB, 测试 节点 来 自 文件 /home/iozone, 结果 输出 到 文 
件 single.xls。 

最 终 测 试 结果 , 分 块 大 小 为 8MB、 文 件 大 小 为 86, 166 左右 取得 最 好 性 能 ， 
单 点 写 入 420MB/S, 单 点 读 2.2GB/S。 

2、 多 节点 性 能 

测试 命令 : ./iozone -a -g 64G -i O-i 1-i 2 -f /home/nodes -Rb multi.xls 

参数 说 明 : 使 用 全 自动 模式 , 生成 包括 所 有 测试 报告 , 使 用 的 块 大 小 从 4KB 
到 16MB， 最 大 测试 文件 64GB, 测试 节点 来 自 文件 /home/nodes，nodes 文件 中 
含有 8 个 节点 ， 结 果 输 出 到 文件 multixls. 

最 终 测 试 结果 , 分 块 大 小 为 8192KB、 文件 大 小 为 65MB 左右 取得 最 好 性 能 ， 
多 节点 写 入 960MB/S 左右 , 多 节点 读 5.1GB/S 左右 ， 具 体 见 图 4、 图 5。 
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4、 结 论 


以 新 疆 天 文 台 的 实际 需求 为 基础 设计 并 实现 了 NSRT 观测 数据 的 在 线 存 储 
与 备份 系统 ， 两 套 存 储 系统 分 别 建设 于 新 疆 天 文 台 本 部 与 南山 观测 站 ， 实 现 了 
远程 、 异 地 、 容 灾 备 份 。 对 存储 系统 进行 了 读 写 性 能 测试 ， 单 节点 、 多 节点 读 
写 速度 目前 可 以 满足 NSRT 数据 管理 需要 。 采 用 了 基于 对 象 的 存储 技术 , 所 建设 
的 存储 系统 具有 良好 的 性 能 和 可 扩展 性 。 


致谢 : 
NSRT 存储 系统 建设 过 程 中 的 测试 部 分 在 新 疆 天 文 台 数据 中 心 及 Taurus 高 
性 能 计算 系统 上 完成 。 
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Abstract: 


After years of observation, Xinjiang Astronomical Observatory(XAO) Nanshan 26 meters radio 
telescope (referred to as NSRT) had accumulated massive scientific data. A remote backup 
system was established for the online data storage of NSRT, this redundant storage system 
contains two storage clusters, one cluster was in XAO headquarters and another one located in 
Nanshan station, the real-time synchronization of NSRT data can be realized between two 
storage clusters. Based on the object storage technology, centralized Luster storage system was 
created for storage clusters, and the I/O performance test of luster systems was finished. 
Redundant storage system solved the online archive and data safety issue for NSRT data. 


Keywords: Observational Data; Storage; Backup; VO; Data Safety 


